# -*- coding: utf-8 -*-
# @日期 : 2022/1/24 0024
# @作者 : sean
# @版本 : v1.0
# @功能 :


# xpath 实在xml文档中搜索内容的一门语言

from lxml import etree


xml="""
 <div class="mt-40">
    <div class="class-title-text">
        一级分类：
    </div>
    <ul id="sort1" style="margin-left: 10px;">
        <li class="lis" ><a href="javascript:cat(1186)">蔬菜</a></li>
        <li class="lis" ><a href="javascript:cat(1187)">水果</a></li>
        <li class="lis" ><a href="javascript:cat(1189)">肉禽蛋</a></li>
        <li class="lis" ><a href="javascript:cat(1190)">水产</a></li>
        <li class="lis" ><a href="javascript:cat(1188)">粮油</a></li>
        <li class="lis" ><a href="javascript:cat(1203)">豆制品</a></li>
        <li class="lis" ><a href="javascript:cat(1204)">调料</a></li>
    </ul>
    <a href="javascript:cat(1205)">酒水</a>
 </div>
"""

tree = etree.XML(xml) # 加载xml
# result = tree.xpath("/div") # 返回根div
# result = tree.xpath("/div/ul/li") # 返回所有的li
# result = tree.xpath("/div/ul/li/a/text()") # text() 返回所有的a标签 文本
result = tree.xpath("/div//a/text()") # //后代   取所有a标签 文本
print(result)